<meta charset="utf-8"/>
<?php
set_time_limit(0);
require 'function.php';



// //采集所有的页数
// $url = 'http://www.ict.ac.cn/xwzx/jssxw/';
// $str = curl_get($url);
// // 链接地址的模版
// $mode = "http://www.ict.cas.cn/xwzx/jssxw/index";

// $pattern = "/共(.*?)页/";
// preg_match_all($pattern,$str,$arr);
// $all = $arr[1][0];

// $page_url = array();
// for($i=0;$i<$all;$i++){
// 	if($i !=0){
// 		$url = $mode.'_'.$i.'.html';
// 	}
// 	else{
// 		$url = $mode.'.html';
// 	}
// 	array_push($page_url,$url);
// }


// //采集所有页面的文章链接
// foreach ($page_url as $k => $v) {
// 	$str = curl_get($v);
// 	$pattern = "/<a href=\"(.*?)\" target=\"_blank\" class='cn51black14'>/";
// 	preg_match_all($pattern,$str,$arr);
// 	$prefix = 'http://www.ict.ac.cn/xwzx/jssxw/';
// 	$all_url = $arr[1];
// 	$new = array();
// 	foreach($all_url as $key=>$value){
// 		$value = str_replace('./',$prefix,$value);
// 		array_push($new,$value);
// 	}	
// }


//这部分是采集单篇文章
$big_arr = array();
foreach($new as $key=>$value){
	$data = article_spider($value);
	array_push($big_arr,$data);
}
//调用追加函数
write_all($big_arr);	





// //路径
// // $url = "http://www.ict.ac.cn/xwzx/jssxw/201611/t20161129_4711412.html";
// $url = "http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html";


// $url = array(
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html',
// 	'http://www.ict.ac.cn/xwzx/jssxw/201611/t20161118_4698403.html'
// );














